180+植物基因组解读 | 第二章十字花科——玛卡
第二章十字花科
地表最强植物基因组文献解读,正在继续。科技君和小伙伴们特地对植物基因组领域已发的180多篇高质量文章进行收集、解读和归类,经归纳整理后共分十章,前九章为相关领域已发表物种文献解读,最后一章为植物基因组未来发展趋势及预测。
地表最强植物基因组解读,第二章十字花科,本期将为大家解读“Genome of Plant Maca (Lepidium meyenii) Illuminates Genomic Basis for High-Altitude Adaptation in the Central Andes”,该文章发表于 Molecular Plants,测序了玛卡基因组。
十字花科往期回顾
12、玛卡
玛卡(Lepidium meyenii)在植物分类上属于十字花科,它是一个起源于秘鲁安第斯山脉,后经人工改良的重要经济植物。在5百万到1千万前,安第斯山脉地质活动剧烈,经历了一个快速抬升的时期,而玛卡在短短的5百万年里能如此快速的适应高原环境,是一个非常值得探讨的生物学问题。
文献题目: Genome of Plant Maca (Lepidium meyenii)Illuminates Genomic Basis for High-Altitude Adaptation in the Central Andes
发表期刊: Molecular Plants
发表时间:2016年6月
影响因子:8.8
摘要介绍:该文章比较了基因组分析,显示玛卡及其近源的十字花科物种基因组经过全基因组复制,导致了其中很多基因家族发生了扩张,这些扩张的基因与应激反应、荷尔蒙信号转导、次生代谢等有关。这些经过复制,保留或亚功能化的基因可能导致玛卡的形态,生理改变来适应高原环境。此外,我们还发现一些多拷贝的基因与形态适应及生物胁迫响应相关,并且这些基因受正选择。总之,玛卡基因组的完成对于我们研究全基因组复制及植物的高原适应性有着重大意义。
内容解析
研究问题:
1. 通过比较分析阐明玛卡的两次全基因组复制事件
2. 玛卡特殊叶片形态的基因挖掘
3. 玛卡高原适应性基因的鉴定
4. 玛卡自交亲和原因的研究
5. 玛卡正选择基因的鉴定
研究方向:
1. 玛卡De novo基因组学研究
2. 玛卡重复序列以及全基因组复制分析
3. 玛卡的环境适应性
研究亮点:
1. 通过比较分析阐明玛卡的两次全基因组复制事件
2. 玛卡特殊叶片形态的基因挖掘
3. 玛卡高原适应性基因的鉴定
4. 玛卡自交亲和原因的研究
研究方法
研究对象:从秘鲁4000米高原引进后经过人工驯化20代的玛卡植株,现在种植于云南昆明。
所用软件:
SOAPdenovo组装、Tophat、Cufflinks转录组比对和表达量计算;
RepeatMasker,RepeatProteinMask,LTR-FINDER, CENSOR 转座子分析;
Augustus, GlimmerHMM,EVM, tRNAscan-SE , INFERNAL基因预测和功能注释;
MUSCLE,Mcscan ,OrthoMCL,多序列比对,共线性分析,家族聚类;
PAML计算分歧时间、正选择等;
Café基因家族收缩扩张;
所用数据:
玛卡的基因组序列,玛卡的叶和根的转录组测序数据
所用数据库:
Repbase,Phytozome v9.1,Rfam databases等数据库
研究成果
1. 在这项研究中,研究人员分别对玛卡进行了全基因组测序,743M基因组大小。通过将reads数据比对回参考基因组序列估计出这个物种的杂合率约为0.2%。核心基因集的评价方法显示基因组有较高的组装质量,基因注释出96417个编码基因及18885个非编码基因。研究发现玛卡基因组包含47%以上的重复序列,比其它的十字花科物种中重复序列含量高。基因家族分析显示玛卡中含有大量基因发生了扩张,而这些扩张的基因和生物应激,荷尔蒙信号转导,次生代谢等过程相关。
2. 通过玛卡和拟南芥的共线性比较中,研究人员发现了在玛卡和拟南芥的基因组上存在很多4:1的共线性快,这样的共线性块可以推测出玛卡经历了2次特异的全基因组复制事件。通过4dTv估算这两次全基因组复制事件发生的时间大概在6.7百万年前,通过基因家族分析也发现玛卡上保留了很多经过全基因组复制而产生的多拷贝基因,这些基因可能是其能够适应高海拔的安第斯山的原因。
3. 玛卡中叶的形态方面基因的进化问题。KNOX同源盒蛋白(Knotted1-like homebox,KNOX)是具有同源异型结构域的转录因子,它在植物顶端分生组织中对维持细胞多能性等具有重要作用。通过比较分析发现了玛卡经过2轮全基因组复制事件保留了13个KNOX基因,这些可能是导致其叶片形状独特的原因。CUC和RCO基因可以通过不同的机制,控制叶片边缘形成锯齿状。通过比较发现玛卡中有4个CUC2基因,除了一个基因存在突变,其他三个基因都不能被miR164a沉默(图3C)CUC2和MIR164A之间的这种不平衡可能最终有利于玛卡的锯齿状叶边缘的形成。控制叶子的侧叶分支形成的RCO基因在玛卡里有8个且这些基因成簇分布,而在拟南芥中是0个。
4. 抗寒与紫外辐射相关基因的研究。生活在4000多米海拔的安第斯山脉,对于植物来说必然面临两个问题:寒冷和高的紫外辐射。我们研究了玛卡上与抗寒和紫外辐射通路的相关基因,发现这两种基因很多都在叶和根中高表达,结果表明明全基因组复制是导致其适应性产生的一个重要原因。
5. 玛卡中自交不亲和基因S-Locus基因的丢失。很多开花植物都是通过自交不亲和这种生殖方式来避免近交而导致后代低的多样性。尽管如此,也有一些植物的进化过程是从自交不亲和向自花授粉转变。十字花科中控制自交不亲和这一性状的是SCR和SRK和这2个基因。在自花授粉的物种拟南芥中研究发现这2个基因处于失活状态。而在玛卡中,我们发现这2个基因完全丢失了,丢失的两个基因导致了玛卡的自交亲和性状。这也可能是其适应高原环境的一个重要因素。
6. 玛卡里的正选择基因。通过ka/ks值可以判断物种中基因的进化类型,研究发现玛卡中存在一些和叶形态,紫外辐射,抗寒等相关基因存在正选择。这些正选择的基因,也有利于玛卡的高原适应性。
撰稿:大项目部-光宣敏
编辑:市场部
猜你喜欢
IBC意犹未尽?彩蛋来袭!|180+篇植物基因组文章解读大全
近期热文
请继续关注“华大科技BGITech”公众号,
科技君将一如既往地为您提供精彩内容!
如有相关问题,欢迎后台留言~~
▼
关注华大科技,尽享精彩科研!